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摘要 在 数字 经 济 发 展 与 总 体 国家 安全 观 的 双重 时 代 背 景 下 ， 数 据 主权 已 成 为 国家 主权 的 重要 组 成 部 分 。 各 
主要 国家 和 地 区 积极 开展 数据 主权 战略 部 署 ， 在 数据 资源 、 数 据 技术 和 数据 规则 方面 展开 激烈 竞争 与 博弈 。 
文章 采用 政策 文本 分 析 方法 研究 我 国 数据 主权 政策 ， 运 用 LDA (Latent Dirichlet Allocation) 主题 模型 和 政策 
工具 量化 分 析 中 国 数据 主权 政策 的 过 程 演化 、 主 题 特 征 ， 并 综合 考虑 全 球 数据 主权 态势 ， 提 出 4 条 政策 建议 : 
积极 主导 和 参与 国际 规则 制定 ; 优化 数据 出 境 安全 评估 流程 ; 完善 个 人 信息 出 境 标准 合同 模版 ; 强化 数据 安 


全 法 治 保障 。 
关键 词 ”数据 主权 ， 数 据 安全 ， 政 策 工具 ，LDA 模型 
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数据 主权 是 指 一 个 国家 对 其 政权 管辖 范围 内 的 网 。 源 所 具有 的 战略 价值 ， 积 极 开 展 数 据 主权 战略 部 署 。 
络 设施 、 数 据 主体 、 数 据 行 为 和 数据 资源 及 相关 数据 ”由 于 技术 能 力 和 经 济 发 展 状况 不 同等 因素 ,各 国 采取 
品 具 有 生成 、 传 播 、 管 理 、 控 制 、 利 用 和 保护 的 主 。 了 差异 化 的 数据 主权 政策 。 
导 权 中 I， 其 正在 成 为 数字 时 代 国 家 主权 的 重要 组 成 部 数据 主权 政策 对 于 维护 国家 安全 、 保 障 国家 利益 
4r. 美国、 欧盟 和 中 国 等 国家 和 地 区 均 认 识 到 数据 资 ” 具有 重要 作用 ， 近 年 来 引起 学 术 界 较为 广泛 的 关注 。 
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有 的 学 者 从 国家 主体 的 视角 提出 了 数据 主权 概念 7， 
也 有 学 者 从 组 织 和 个 人 主体 的 视角 界定 了 数据 主权 内 
涵 区 9。 冉 从 敬 呈 定性 总 结 了 数据 主权 战略 部 署 的 全 球 
态势 。 郑 琳 等 加 阐释 了 国家 数据 主权 概念 ， 并 归纳 分 
析 了 欧美 数据 主权 战略 。 然 而 ， 已 有 研究 主要 通过 定 
性 归纳 方法 从 国家 宏观 层面 剖析 数据 主权 战略 的 特 
点 ， 但 缺乏 关于 数据 主权 政策 文本 内 涵 和 特征 的 定量 
分 析 。 本 文采 用 政策 文本 分 析 方法 "研究 我 国 数据 主 
权 政 策 ， 运 用 LDA (Latent Dirichlet Allocation). 主题 
模型 ?和 政策 工具 ”定量 分 析 中 国 数据 主权 政策 的 演 
化 、 态 势 ， 基 于 此 与 全 球 数据 主权 政策 进行 国际 比较 
并 提出 对 策 与 建议 。 这 一 研究 既 拓展 了 政策 文本 分 析 
方法 的 应 用 领域 ， 将 其 应 用 于 数据 主权 领域 的 政策 分 
析 ， 也 为 优化 设计 我 国 数据 主权 政策 提供 方法 论 
指导 。 


1 数据 主权 政策 研究 的 分 析 框 架构 建 与 设计 


1.1 研究 方法 与 框架 维度 

本 文 从 政策 工具 的 角度 出 发 ， 运 用 LDA 主题 模型 
XJ P E 2010—2022 年 的 数据 主权 相关 政策 进行 分 析 与 
量化 。 本 文 建立 了 数据 主权 政策 工具 的 分 析 框 架 (图 
1)。Q 对 政策 文本 进行 统计 分 析 ， 围 绕 政 策 时 间 、 政 
策 机 构 和 政策 类 型 分 布展 开 ， 探 究 数据 主权 政策 的 演 
化 过 程 、 机 构 分 布 和 政策 效力 。@) 供给 型 、 环 境 型 和 
需求 型 政策 工具 分 类 法 在 既 有 人 研究 中 最 为 常见 3， 本 
文采 用 此 种 政策 工具 的 维度 划分 对 数据 主权 政策 进行 
编码 分 析 。@@ 运用 LDA 主题 模型 挖掘 数据 主权 政策 
文本 中 的 核心 主题 词 ， 并 进行 可 视 化 展示 。 


一 > ”政策 时 间 分 布 
> 政策 文本 统计 分 析 一 一 > ”政策 机 构 分 布 
— 政策 类 型 分 布 


> ”需求 型 政策 工 
> 政策 工具 维度 分 析 > 环境 型 政策 工 


> ”供给 型 政策 工 


数据 主权 政策 


—> LDA 模型 
> 政策 主题 维度 分 析 


—> HATAK 


图 1 数据 主权 政策 研究 框架 


Figure 1 Data sovereignty policy research framework 


1.2 数据 来 源 及 编码 

本 文选 用 “北大 法 宝 在 线 数据 库 ”“ 作 为 数据 主 
权 相 关 政策 文本 的 收集 来 源 ， 以 “数据 主权 ”“ 数 据 
安全 ”“ 数 据 跨 境 ”“ 国 家 安全 ”等 关键 词 搭配 组 合 进 
行 全 文 检 索 ， 筛 选 “ 中 央 法 规 ” 政 策 文件 作为 分 析 文 
本 ， 共 计 收 集 45 份 政策 文件 〈 表 1 展示 了 部 分 数据 主 
权 政 策 文本 )。 对 纳入 样本 的 45 份 中 央 法 规 政策 文件 
进行 摘录 和 编码 (部 分 数据 主权 政策 文件 内 容 编 码 情 
况 见 表 2)， 以 便 更 清晰 地 标注 不 同 政策 与 具体 条 款 中 
包含 的 政策 工具 ， 将 非 结构 化 的 文本 数据 进行 转换 用 
于 定量 分 析 。 


2 数据 主权 政策 总 体 情 > 


2.1 政策 时 间 演 化 分 布 

根据 政策 文本 的 发 布 时 间 统 计 结 果 ， 中 国 数据 主 
权 相 关 政策 始 于 2012 年 5 月 工信部 发 布 的 《互联 网 行 
业 “ 十 二 五 ”发 展 规划 》 “数据 主权 ”这 一 名 词 首次 


CD. 政策 文本 分 析 是 政策 研究 的 主要 范式 之 一 , 它 以 政策 内 涵 、 政 策 工 具 等 为 主要 研究 内 容 , 利 用 定量 分 析 对 文本 条 例 作 出 深入 


冰释 与 分 析 , 对 于 政策 解读 和 实施 具有 重要 意义 。 


(2 LDA 主题 模型 是 针对 海量 长 文本 数据 进行 概率 主题 建 模 的 自然 语言 处 理 模型 ,可 以 抽象 为 三 层 贝 叶 斯 模型 “文本 一 主题 一 
词 ” 。 作 为 识别 文档 主题 分 布 的 典型 方法 ,LDA 主题 模型 在 文本 主题 挖掘 .文本 情感 分 析 等 领域 具有 广泛 应 用 。 

O 已 有 研究 从 不 同 角度 对 政策 工具 进行 分 类 ,包括 供给 型 、 环 境 型 和 需求 型 政策 工具 的 界定 方式 ,市 场 工具 和 行政 工具 的 划分 
方法 。 供 给 型 .环境 型 和 需求 型 政策 工具 分 类 法 在 既 有 研究 中 最 为 常见 ,该 方法 综合 考虑 了 政府 干预 手段 和 干预 程度 。 

D “北大 法 宝 在 线 数据 库 ” 网 址 为 https://libyw.ucas.ac.cn/https/1SjapK4g9QWMKZdqGX5SBIacUGddK7Z07CpDY/. 
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表 1 部 分 数据 主权 政策 文本 
Table 1 Part of data sovereignty policy text 
序号 政策 名 称 效力 级 别 发 布 部 门 发 布 日 期 实施 日 期 
1 《中 华人 民 共 和 国 个 人 信息 保护 法 》 法 律 全 国人 大 常委 会 2021 年 8 月 20 日 2021 年 11 月 1 
2 《中 华人 民 共 和 国 海南 贸易 港 法 》 法 律 全 国人 大 常委 会 2021 年 6 月 10 2021 年 6 月 10 
3 《中 华人 民 共 和 国 数据 安全 法 》 法 律 全 国人 大 常委 会 2021 年 6 月 10 2021 年 9 月 1 
4 《中 华人 民 共 和 国 网 络 安全 法 》 法 律 全 国人 大 常委 会 2016 年 11 月 7 2017 年 6 月 1 
5 《国务 院 关 于 印发 “十 四 五 ”数字 经 济 发 展 规划 的 通知 》 国 务 院 规范 性 文件 Els [rz 2021*F 12H 12 H 20214£ 12 H 12 
6 《国务 院 关 于 印发 促进 大 数据 发 展 行动 纲要 的 通知 》 ”国务院 规范 性 文件 习 务 院 2015 年 8 月 31 2015 年 8 月 31 
7 《数据 出 境 安全 评估 办 法 》 部 门 规 习 家 互联 网 信息 办 公 室 2022 年 7 月 7 2022 年 9 月 1 
R2 ”部 分 数据 主权 政策 文本 内 容 编码 情况 
Table 2 Encoding of text content of some data sovereignty policies 
序号 政策 名 称 政策 分 析 单 元 编码 政策 工 
1 《中 华人 民 共 和 国 ” 第 十 条 ”任何 组 织 、 个 人 不 得 非法 收集 、 使 用 、 加 工 、 传 输 他 人 个 人 信息 ,不 得 非法 买卖 提供 或 者 a 规 管制 
个 人 信息 保护 法 》 公开 他 人 个 人 信息 ;不 得 从 事 危害 国家 安全 、 公 共 利 益 的 个 人 信息 处 理 活动 。 iin 
E 《中 华人 民 共 和 国 ” 第 十 一 条 ”国家 积极 开展 数据 安全 治理 、 数 据 开 发 利用 等 领域 的 国际 交流 与 合作 ,参与 数据 安全 49 Bie 
数据 安全 法 》 ”相关 国际 规则 和 标准 的 制定 ,促进 数据 跨 境 安全 、 自 由 流动 。 dE 
25 《数据 出 境 安全 评 第 三 条 ”数据 出 境 安 全 评估 坚持 事前 评估 和 持续 监督 相 结 合 、 风 险 自 评估 与 安全 评估 相 结 合 , 防 21 审查 评 人 
估 办 法 》 ”” 范 数据 出 境 安全 风险 ,保障 数据 依法 有 序 自由 流动 。 AR 


出 现在 2015 年 国务 院 印 发 的 《促进 大 数据 发 展 行动 纲 
要 》， 指 出 应 “增强 网 络 空间 数据 主权 保护 能 力 ， 维 
护 国 家 安全 ， 有 效 提升 国家 苋 争 力 ”。 然 而,， 早 在 
2010 年 已 经 开始 出 现 互 联网 主权 的 概念 。 数 据 主权 政 
策 发 布 数量 在 2016 年 和 2021 年 迎 来 了 2 次 大 幅 提升 
(图 2)。 结 合 大 数据 、 云 计算 和 区 块 链 等 新 技术 的 出 
现 与 快速 发 展 ， 将 数据 主权 政策 演化 划分 为 4 个 
阶段 。 

(1) 互联 网 主权 阶段 (2010 一 2013 年 )。2010 年 ， 
国务 院 新 闻 办 公 室 发 布 《 中 国 互联 网 状况 》 白 皮 书 ， 
指出 “中 华人 民 共 和 国境 内 的 互联 网 属于 中 国 主 权 管 
辖 范 围 ， 中 国 的 互联 网 主权 应 受到 尊重 和 维护 ”中 
国 逐 步 完 善 互联 网 法 律 法 规 ， 积极 推动 互联 网 基础 设 
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2010 2012 2015 2016 2017 2018 2019 2020 2021 2022 (年 ) 


图 2 2010—2022 年 我 国 数据 主权 政策 发 文 时 间 分 布 
Figure2 Time distribution of China's data sovereignty policy 
from 2010 to 2022 


施 建设 ， 加 强 对 互联 网 的 管理 和 监管 ， 确 保 互 联网 安 
人 全， 推动 互联 网 产业 发 展 。 
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(2) 信息 主权 阶段 (2014 一 2015 年 )。2014 年 7 月 
16 日 ， 习 近 平 主席 在 巴西 国会 发 表 题 为 《弘扬 传统 友 
好 共 谱 合作 新 篇 》 演 讲 ， 强 调 每 一 个 国家 在 信息 领域 
的 主权 权益 都 不 应 受到 侵犯 。 这 一 阶段 ， 相 关 政策 强 
调 加 强 信息 自主 可 控 ， 建 设 信息 基础 设施 ， 推 进 信息 
安全 技术 和 标准 的 研发 ， 提 升 中 国 在 信息 主权 领域 的 
实际 管控 能 力 和 国际 话语 权 。 

(3) 网 络 空间 主权 阶段 (2015—2018 年 ) 2015 
年 7 月 颁布 实施 的 《中 华人 民 共 和 国 国家 安全 法 》 首 
次 明确 了 网 络 空间 主权 的 概念 。 在 2017 年 3 月 发 布 的 
《网 络 空间 国际 合作 战略 》 中 将 “坚定 维护 中 国 网 络 


安全 评估 要 求 、 推 进 数 据 保护 能 力 认 证 机 制 等 ， 以 确 
保 数 据 在 跨 境 流动 过 程 中 得 到 有 效 保 护 和 合 规 使 用 。 
综 上 ， 中 国 的 数据 主权 战略 经 历 了 “互联 网 主权 
一 信息 主权 一 网 络 空 间 主 权 一 数据 主权 ”的 演化 ， 整 
体 政策 特点 为 以 安全 为 纲 ， 推 动 定 规 立 制 ， 促 进 数 据 
有 序 流动 ， 加 强 数据 跨 境 流 动 过 程 和 出 境 后 的 风险 评 
估 和 监管 。 
2.2 政策 发 文 机 构 分 布 
政策 发 文 机 构 能 够 反映 出 各 政策 法 规 的 效力 级 
别 。 国 务 院 、 工 业 和 信息 化 部 、 商 务 部 、 全 国人 大 常 
委 会 等 共计 33 个 机构 参与 数据 主权 政策 制定 ， 表 3 展 


主权 、 安 全 和 发 展 利益 ”作为 中 国 参与 网 络 空间 国际 
合作 的 战略 目标 之 一 。2018 年 5 月 ， 在 国家 互联 网 信 
息 办 公 室 发 布 的 《数字 中 国 建设 发 展 报告 (2017 
4E) 》 中 ,将 “维护 网 络 主权 ”作为 数字 中 国 建设 面 
临 的 形势 和 努力 方向 。 这 一 阶段 ， 相 关 政 策 强 调 加 强 
网 络 安全 保护 、 建 立 网 络 主权 管理 机 制 、 推 进 网 络 空 
间 治 理 等 ， 以 确保 国家 在 网 络 空间 中 有 权利 和 能 力 保 
护 国 家 安全 和 维护 国家 利益 。 

(4) 数据 主权 阶段 (2019 年 至 今 ) 。2019 年 7 月 ， 
《加 强 工 业 互 联网 安全 工作 的 指导 意见 》 指 出 ， 依 据 
工业 门类 领域 、 数 据 类 型 、 数 据 价 值 等 建立 工业 互联 
网 数据 分 级 分 类 管理 制度 ， 开 展 重要 数据 出 境 安全 评 
估 和 监测 。2020 年 9 月 ， 中 国 发 起 《全 球 数据 安全 倡 
议 》， 呼 吁 各 国 未 经 他 国法 律 允许 不 得 直接 向 企业 或 
个 人 调 取 位 于 他 国 的 数据 。2021 年 9 月 开始 施行 的 
《中 华人 民 共 和 国 数据 安全 法 》 规 定 ， 维 护 数据 安全 ， 
应 当 坚 持 总 体 国 家 安全 观 ， 建 立 健全 数据 安全 治理 体 
系 ， 提 高 数据 安全 保障 能 力 ; 同年 , 《中 华人 民 共 和 
国 个 人 信息 保护 法 》 也 对 个 人 信息 的 跨 境 流动 、 数 据 
本 地 化 存储 及 域外 效力 做 出 了 相关 规定 。 这 一 阶段 ， 
相关 政策 强调 建立 数据 分 级 分 类 制度 、 明 确 数据 出 境 


O 发 布 数量 超过 3 份 的 部 门 被 视 为 核心 主体 。 


示 了 发 布 政策 的 核心 机 构 分 布 情况 。 我 国 数据 主权 政 
策 有 联合 发 布 和 单独 发 布 2 种 形式 ; 45 份 中 央 法 规 政 
策 文 件 中 ，8 份 为 联合 发 布 ，37 份 为 单独 发 布 ， 单 独 
发 布 占 比 82.2%。 

基于 统计 结果 可 知 ， 发 布 政策 文件 较 多 的 机 构 依 
次 为 国务 院 、 工 业 和 信息 化 部 、 商 务 部 ; 联合 发 文 的 
主要 为 国家 发 展 和 改革 委员 会 、 工 业 和 信息 化 部 。 政 
策 发 布 核心 主体 共有 5 个 ， 占 比 15.2%， 非 核心 主体 
共有 28 个 ， 占 比 84.8%， 各 政策 主体 在 整体 分 布 上 较 
为 分 散 。 总 体 来 看 ， 参 与 数据 主权 政策 制定 的 主体 众 
多 ,但 核心 主体 的 发 文 数量 占 比 54.2%， 较 为 集中 。 
整体 呈现 出 以 国务 院 、 工 业 和 信息 化 部 、 商 务 部 、 全 
国人 大 常委 会 、 国 家 互联 网 信息 办 公 室 为 五 大 中 心 发 
文 的 结构 特征 〈 表 3)。 
2.3 政策 类 型 分 布 

政策 发 布 所 采用 的 文 种 类 型 因 政策 性 质 和 目标 的 
不 同 而 有 所 差异 ， 由 此 导致 了 不 同 政策 的 效力 不 
同 3 芍 。 本 文 所 收集 的 政策 样本 中 ， 数 据 主权 政策 采 
用 了 9 种 不 同 的 形式 进行 发 布 ， 包 括 方案 、 意 见 、 规 
划 、 法 律 、 通 知 、 纲 要 和 办 法 等 ， 展 现 出 形式 多 样 性 
( 表 4)。 其 中 , 方案、 意见 和 规划 在 政策 文本 中 占 比 
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表 3  2010—2022 年 我 国 数据 主权 政策 核心 发 布 机 构 分 布 情况 
Table3 Distribution of government agencies issuing China's 


data sovereignty policies from 2010 to 2022 


发 布 机 构 发 布 数 量 ( 份 ) 
国务 院 14 
工业 和 信息 化 部 10 
商务 部 8 
全 国人 大 常委 会 4 
国家 互联 网 信息 办 公 室 3 


较 高 ， 这 说 明 现 有 政策 中 相关 部 门 提出 的 见解 和 处 理 
意见 较 多 ; 而 针对 性 更 强 、 更 具体 的 办 法 在 整体 政策 
分 布 中 较 少 ; 全 国人 大 及 其 常务 委员 会 共 颁 布 4 项 
法 律 。 


3 数据 主权 政策 二 维 分 析 


政策 工具 是 政策 主体 为 实现 政策 目标 而 采取 的 具 
体 措施 和 手段 ， 本 文 根 据 已 有 研究 "从 需求 型 、 环 
境 型 和 供给 型 3 个 方面 构建 了 数据 主权 政策 工具 分 析 
维度 ， 通 过 政策 工具 识别 出 政策 实施 的 重要 途径 和 保 
障 措施 ， 并 基于 LDA 主题 模型 进行 政策 主题 分 析 ， 揭 
示 了 政策 的 核心 内 容 和 主要 目标 ， 以 期 为 国家 进一步 
优化 完善 数据 主权 政策 制定 提供 决策 参考 。 


表 4 2010—2022 年 我 国 数据 主权 政策 文 种 类 型 分 布 
Table4 Type distribution of China's data sovereignty policy 


documents from 2010 to 2022 


政策 类 型 发 布 数量 ( 份 ) 分 比 
JIR 11 24.4% 
意见 10 22.296 
规划 T 15.6% 
法 律 4 8.9% 
通知 4 8.9% 
纲要 3 6.796 
报告 3 6.796 
战略 2 4.496 
办 法 1 2.296 
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考虑 到 一 个 政策 分 析 单 元 可 能 同时 应 用 多 种 政策 
工具 ， 因 此 本 文 用 于 分 析 的 政策 工具 数量 之 和 超过 编 
码 单元 总 数 。 从 政策 工具 应 用 类 型 来 看 ， 我 国 数据 主 
权 政 策 对 政策 工具 的 应 用 较为 全 面 ， 需 求 型 、 环 境 
型 、 供 给 型 政策 工具 分 别 占 比 21.6%、59.6%、18.8% 
(图 3)。 其 中 ， 环 境 型 政策 工具 较为 常用 ， 需 求 型 和 
供给 型 政策 工具 应 用 频率 次 之 。 我 国 采用 多 种 政策 工 
有 具 共同 推动 数据 跨 境 安全 流动 和 数据 主权 保护 。 

3.1 政策 工具 维度 的 实证 分 析 

(0) 需求 型 政策 工具 ， 旨 在 引入 各 方 力 量 进行 交 
流 与 合作 ， 积 极 开展 数据 安全 管理 、 跨 境 流动 和 国际 
合作 规则 等 试点 ， 突 出 重要 领域 和 关键 环节 ， 从 而 促 
进 数据 安全 有 序 流 动 ( 表 5)。 需 求 型 数据 主权 政策 工 
具 以 试点 示范 和 国际 合作 为 主 ， 着 重 于 通过 试点 示范 
和 国际 合作 等 发 展 模式 先行 先 试 ， 积 累 数 据 安全 管理 
和 数据 主权 保护 有 效 经 验 并 推广 普及 于 全 社会 ， 注 重 
引导 社会 力量 参与 ， 开 展 宣传 推广 ， 从 而 推动 行业 规 
范 发 展 、 提 高 数据 主权 保护 意识 。 

(2) 环境 型 政策 工具 ， 站 在 通过 优化 各 主体 、 各 
环节 实施 的 环境 条 件 、 政 策 导 向 、 标 准 规范 和 问 责 机 
制 等 引导 和 监管 各 主体 采取 更 积极 的 数据 安全 管理 和 
数据 主权 保护 措施 ( 表 6)。 整 体 而 言 ， 环 境 型 政策 工 


需求 型 
21.6% 


环境 型 
59.6% 


图 3 2010—2022 年 我 国 数据 主权 政策 工具 频率 分 布 
Figure3 Frequency distribution of China's data sovereignty 


policy instruments from 2010 to 2022 
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表 5 ”需求 型 数据 主权 政策 工具 的 内 涵 与 维度 


Table 5 Connotation and dimensions of demand-based data sovereignty policy instruments 


IRAN 体内 涵 关键 词 
— 蝴 数 据 安全 管理 、 跨 境 流动 和 国际 合作 规则 等 试点 ,突出 重要 领域 和 关键 环节 ,及 时 总 结 推广 地 方 经 验 ,发 挥 试点 .试验 
RA 重点 改革 的 突破 性 作用 和 试点 的 带动 效应 lo 
服务 外 包 !9 政府 鼓励 或 组 织 社会 第 三 方 机 构 参 与 到 数据 安全 评估 、 数 据 保 护 认 证 等 过 程 第 三 方 
时 社会 各 共同 参 : 共享 、 BIET. ES 等 工作 ,实现 多 方 融合 高 效 协 作 , 如 喜 企 、 : 
社会 参与 3 不 VESPA) 参与 数据 数据 数据 主权 保护 见 多 方 融合 、 高 效 协作 ,如 鼓励 政 企 调动 激 而 
校 企 合作 
x E p zE 识 宣 El t] X 和 3g. j 共 FaF Dy 2 D x 合理 T CAES, 
宣传 推广 : 数据 知识 宣传 普及 ,加 大 对 数据 数据 开放 家 标准 的 7l 引导 证 论 言传 .教育 
营造 良好 氛围 
国际 合作 ”积极 参与 国际 规则 制定 ,促进 跨 境 数据 共享 和 技术 合作 ,加 强 保护 治理 合作 等 国际 交流 、 合 作 


有 具 占 比 超过 半数 ,作为 一 种 间接 调控 手段 "" 受 到 政策 
主体 的 青睐 。 法 规 管制 是 常用 方法 ， 随 着 新 技术 的 发 
展 ， 数 据 规模 不 断 扩 大 ， 国 际 数据 主权 威胁 等 问题 日 
益 凸 显 ， 需 要 加 强 规制 积极 应 对 域外 效力 等 问题 。 标 
准 规范 、 安 全 规范 、 保 障 措施 和 审查 评估 是 引导 新 兴 
数字 产业 规范 发 展 、 保 障 数据 安全 有 序 流动 等 正在 逐 
步 完善 的 政策 文件 ， 包 括 跨 境 流通 准则 、 安 全 评估 和 
保障 机 制 等 。 策 略 性 措施 对 政策 体系 起 到 补充 作用 。 
当前 知识 产权 政策 工具 应 用 较 少 ， 是 数据 主权 政策 中 


(3) 供给 型 政策 工具 ， 旨 在 为 各 主体 的 数据 安全 
管理 、 数 据 主权 保护 、 信 息 基 础 设施 建设 、 技 术 研 
发 、 人 才 培 养 、 统 筹 协 调 等 提供 各 类 资源 支持 〈 表 
7)。 在 供给 型 政策 工具 中 ， 信 息 基础 设施 建设 、 技 术 
支持 和 组 织 建设 占 比 较 高 。 随 着 大 数据 、 云 计算 和 区 
块 链 等 新 技术 的 出 现 ， 信 息 化 设施 成 为 数字 经 济 发 展 
的 重要 基础 条 件 。 《中华 人民 共和 国 国 民 经 济 和 社会 
发 展 第 十 四 个 五 年 规划 和 2035 年 远景 目标 纲要 》 和 
《中 华人 民 共 和 国 网 络 安全 法 》 均 提出 要 建立 健全 关 


的 明显 空白 点 。 键 信息 基础 设施 保护 体系 。 技 术 支 持 是 保障 数据 安全 
R6 环境 型 数据 主权 政策 工具 的 内 涵 与 维度 
Table 6 Connotation and dimensions of environmental data sovereignty policy instruments 
工具 名 称 体内 涵 关键 词 
法 规 管制 政府 通过 设 定 法 律 法 规 、 部 门 规章 、 工 作 办 法 、 问 责 机 制 | 等 强制 措施 来 加 强 对 数据 主权 、 数 据 安全 、 数 据 跨 法 规 监管 
境 等 的 监管 与 保护 
查 评估 ”政府 加 强 对 数据 安全 的 审查 ,并 对 各 地 试点 工作 开展 情况 进行 评估 审查 、 评 估 
标准 规范 ”政府 制定 与 数据 主权 、 数 据 安全 、 数 据 共享 等 相关 政策 的 标准 规范 标准 、 规 范 、 规 则 
标 规划 ”加强 数 据 资源 规划 ,对 数据 安全 、 数 据 主权 做 出 总 体 目标 和 规划 标 、 规 划 
REA zz s 共 N ESI. E SB I 9 各 项 策 JE f, Ei 用 E 
策略 性 措施 rores 居 安 全 、 数 据 共享 数据 跨 境 、 数 据 主权 保护 等 所 制定 的 各 项 策略 性 措施 , 如 鼓励 创新 、 鼓 励 创新 .探索 .统筹 .鼓励 
协同 融合 、 统 筹 兼顾 、 探 索 培 育 新 业态 等 
大 安全 、 s D: j 5 5; FI ,制定 的 各 页 p EHE, 监管 、 
保障 措施 为 dine 因 安 全 数据 主权 保护 、 数 据 跨 境 流动 等 工作 ,制定 的 各 项 保障 措施 ,如 推进 协作 、 强 化 机 机 制 .保障 
制 建设 等 
平台 建设 ”政府 搭建 数据 开放 、 共 享 、 交 易 、 监 管 .预测 平台 平江 
安全 规范 ”政府 制定 数据 安全 相关 工作 的 安全 标准 、 行 业 规范 等 安全 、 规 范 
知识 产权 ”强化 数据 及 知识 产权 保护 ,提高 知识 产权 保护 意识 知识 产权 
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流动 的 重要 力量 ， 应 通过 开发 核心 技术 构建 安全 可 靠 
的 数据 流通 环境 。 在 组 织 建设 的 统筹 协调 下 ， 信 息 基 
础 设施 建设 和 技术 支持 相辅相成 ， 为 数据 安全 流动 和 
数据 主权 保护 提供 持续 动力 。 当 前 人 才 支 持 和 资金 文 
持 政 策 工 具 应 用 较 少 ， 分 别 为 6.67% 和 8.89%。 资 金 
支持 具有 定向 性 优势 ， 人 才 培 养 则 具有 长 期 效益 ， 应 
适当 增加 这 两 个 政策 工具 的 应 用 。 
3.2 政策 主题 维度 的 实证 分 析 
3.2.1 LDA 主题 模型 主题 数 与 一 致 性 分 析 

LDA 主题 模型 可 用 于 挖掘 大 量 文本 的 潜在 主题 特 
征 。 它 是 一 种 无 监督 的 、 非 结构 化 的 概率 模型 ， 运 
了 单词 共 现 具 有 语义 关联 的 规律 ， 无 需 预 先 设 置 字典 
或 主题 类 别 便 可 发 现 文档 语料库 中 的 潜在 主题 外 ， 减 
少 了 人 研究 者 主观 判断 对 主题 分 类 的 影响 趾 。 本 文 将 每 
个 编码 单元 视 为 一 个 文档 ， 选 择 主题 一 致 性 指标 模型 
用 于 判定 最 优 主 题 数量 ， 若 一 致 性 处 于 较 高 水 平 ， 模 
型 的 主题 结构 将 更 加 稳定 。 本 文选 用 “哈工大 停 用 词 
表 ”® 对 文档 进行 文本 预 处 理 ( 中 文 分 词 、 去 停 用 
词 ) ， 主 题 数 与 一 致 性 结果 如 图 4 所 示 。 通 过 主题 评 
估 ， 本 文选 用 3 作为 主题 个 数 ， 并 使 用 pyLDAvis 算法 
对 LDA 主题 模型 结果 进行 可 视 化 分 析 与 展示 。 
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主题 数量 UT) 
图 4 2010—2022 年 我 国 数据 主权 政策 主题 数 划 分 的 
一 致 性 分 析 


Figure 4 Coherence analysis of division of topic numbers in 


China's data sovereignty policy from 2010 to 2022 


3.2.2 词 云 可 视 化 

5 展示 了 基于 LDA 主题 模型 挖掘 出 的 数据 主权 
政策 的 主题 词 袋 (bag of words) “。 根 据 LDA 主题 模 
型 可 视 化 结果 ， 当 前 数据 主权 政策 分 为 3 类 : 数据 安 
全 与 个 人 信息 保护 ; 数据 路 境 与 国际 合作 ; 数据 安全 
评估 与 数据 出 境 。 

(1) 数据 安全 与 个 人 信息 保护 (图 5a)。 推 动 建设 
全 面 数 据 安全 保护 体系 ， 包 括 完善 数据 分 级 分 类 制度 
和 个 人 信息 授权 使 用 制度 。 为 形成 数据 资源 汇集 共 


表 7 供给 型 数据 主权 政策 工具 的 内 涵 与 维度 


Table7 Connotation and dimensions of supply-based data sovereignty policy instruments 


工具 名 称 体内 涵 关键 词 
信息 基础 设施 建设 加 强 与 数据 主权 、 数 据 跨 境 、 数 据 安全 相关 的 信息 或 数字 基础 设施 的 建设 与 提升 ”信息 基础 设施 保护 、 数 字 基 础 设施 建设 
人 才 支 持 加 大 对 技术 研发 .数据 安全 和 涉外 法 治 等 人 才 的 培养 ,培养 复合 型 国际 人 才 人 才 培 养 .教育 培训 
资金 支持 政府 层面 对 数据 主权 相关 政策 的 制定 与 实施 给 予 财政 补助 和 资金 支持 财政 投入 、 资 金 支持 
政策 支持 加 大 对 跨 境 贸易 、 数 据 分 类 、 数 据 安全 规范 等 方面 的 政策 支持 力度 政策 支持 
技术 支持 加 强 数 据 安全 、 网 络 安 全 等 关键 技术 的 研发 创新 与 应 用 技术 研发 技术 创新 
组 织 建设 加 强 数 据 主权 保护 、 数 据 跨 境 、 数 据 安全 等 工作 的 组 织 领导 和 统筹 并 协调 各 部 门 组 织 领导 .统筹 协调 .监管 协作 


分 工 ,协调 监管 与 保护 ,切实 加 强 工作 指导 


(€) 叭 工大 停 用 词 表 是 由 哈尔滨 工业 大 学 自然 语言 处 理 实验 室 发 布 的 一 个 停 用 词 表 。 它 包含 了 常用 的 中 文 停 用 词 , 如 "的 ”“ 是 ” 
“在 “你 们 ”等 。 该 停 用 词 表 的 规模 较 大 ,可 用 于 大 多 数 中 文 自然 语言 处 理 任务 。 停 用 词 是 在 文本 处 理 中 被 过 滤 或 忽略 的 党 
见 词汇 ,它们 在 文本 中 出 现 的 频率 较 高 ,但 往往 对 文本 含义 和 主题 没有 实质 性 贡献 。 


CD 在 一 篇 文档 中 仅 考虑 词汇 是 否 出 现 而 不 考虑 出 现 的 顺序 。 
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享 、 数 据 流动 安全 有 序 的 数据 要 素 良 性 发 展 格局 ， 应 
受 善 处 理 国 家 安全 、 数 据 跨 境 流 通 和 个 人 隐私 保护 三 
者 的 关系 。 

(2) 数据 跨 境 与 国际 合作 (图 5b)。 明 确 数据 安 
全 法 在 域外 的 适用 效力 ， 进 一 步 健全 数据 跨 境 流通 规 
范 ， 实 施 数据 跨 境 传输 与 安全 管控 试点 。 探 索 加 入 区 
域 性 国际 数据 跨 境 流 通 规则 制定 ,促进 形成 数据 里 境 
流通 的 全 球 协同 机 制 ， 强 化 中 国 同志 界 其 他 国家 和 地 
区 之 间 的 安全 协作 与 信息 资源 共享 。 

(3) 数据 安全 评估 与 数据 出 境 (图 5c)。 健 全 数 
据 分 级 分 类 管理 制度 和 数据 出 境 安 全 审查 机 制 。 确 保 
数据 在 出 境 前 能 够 进行 全 面 的 事前 评估 、 持 续 监 督 和 
风险 自 评 佑 ， 有 效 识别 和 防范 数据 出 境 带 来 的 安全 风 
险 ， 保 护 国家 和 个 人 的 敏感 信息 。 探 索 数据 保护 能 
认证 机 制 设计 ， 为 数据 出 境 提 供 客观 和 可 信 的 评估 标 
准 ， 确 保 数据 的 合法 性 、 安 全 性 和 可 控 性 。 

综 上 ， 中 国 数据 主权 政策 主要 运用 了 环境 型 政策 
工具 ， 辅 之 需求 型 和 供给 型 政策 工具 ， 推 动 数据 路 境 
安全 流动 和 数据 主权 保护 。 政 策 文本 内 容 呈 现 出 “ 数 


据 安 全 与 个 人 信息 保护 ”“ 数 据 跨 境 与 国际 合作 ”“ 数 
据 安全 评估 与 数据 出 境 ” 三 大 主题 特征 。 我 国 陆续 制 
定 了 《中 华人 民 共 和 国 个 人 信息 保护 法 》《 中 华人 民 
共和 国 数据 安全 法 》 等 法 律 ， 出 台 了 《数据 出 境 安 全 
评估 办 法 》 等 一 系列 规章 制度 ， 实 行 严格 数据 出 境 和 
言 息 保护 管理 模式 ， 确 保 我 国 数据 主权 得 以 保护 。 


T 


4 启示 与 建议 


本 文 在 对 数据 主权 领域 政策 进行 分 析 的 基础 上 ， 
对 我 国 数据 跨 境 安 全 流动 与 数据 主权 保护 提出 4 条 政 
策 建 议 。 

(1) 积极 主导 和 参与 国际 规则 制定 ， 建 立 互 信 机 
制 ， 提 高 国际 话语 权 。 积 极 主导 和 建设 性 参与 制定 、 
完善 数字 时 代 的 国际 规则 和 标准 ， 与 更 广泛 的 国家 建 
立 多 种 形式 的 数据 合作 平台 ， 就 数据 基础 设施 建设 、 
数据 资源 开发 利用 、 数 据 安全 保障 等 方面 进行 技术 支 
持 和 能 力 建设 ， 促 进 数据 互联 互通 和 共享 共 赢 。 推 动 
与 其 他 国家 或 地 区 在 数据 保护 水 平 、 标 准 、 规 范 等 方 
面 的 合作 讨论 ， 争 取 更 多 一 致意 见 和 共识 ， 实 现 数据 


C 
| 
数据 出 境 MEN — — 

企业 -R———— 


总 体 术语 频率 


mea 
国家 网 信 部 门 ESI [| 主题 内 估计 术语 频率 


图 5 2010 一 2022 年 我 国 数据 主权 政策 的 主题 词 袋 
Figure 5 Bag of words for China's data sovereignty policy from 2010 to 2022 
(a) 主题 1 “数据 安全 与 个 人 信息 保护 "; (b) 主题 2>“ 数 据 跨 境 与 国际 合作 ”; (c) 主题 3 “数据 安全 评估 与 数据 出 境 ”; 
图 中 为 各 主题 按 出 现 概率 由 高 到 低 排序 的 前 30 个 词 ， 代 表 了 各 自 对 主题 的 贡献 度 
(a) Topic 1 “data security and personal information protection"; (b) Topic 2 “data cross-border and international cooperation"; 
(c) Topic 3 *data security assessment and data export"; The figure shows top 30 most relevant terms for topics, representing their 


contributions to the topic 
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保 


和 
对 
强 
frs 
信 


率 和 准确 性 。 例 如 ， 可 以 通过 引入 人 工 智 
分 析 技 术 等 自动 化 评估 流程 ， 快 速 
日 境 行为 ， 以 


力 
内 


来 ， 
1、 企业 或 个 人 的 业务 需求 ， 制 定 更 多 可 以 选择 的 模 


织 


块 ， 


以 总 体 国家 安全 观 为 指导 ， 完 


法 


护 标准 和 规范 的 相互 认可 或 互惠 适当 性 。 

(2) 优化 数据 出 境 安 全 评估 流程 ， 提 高 评估 效率 
准确 性 。 建 立 以 风险 为 导向 的 数据 分 类 管理 制度 ， 
不 同类 型 和 等 级 的 数据 采取 差异 化 的 管控 措施 ， 加 
数据 安全 评 佑 的 标准 制定 和 实施 ， 明 确 数据 安全 评 
的 要 求 和 指导 ， 确 保 数 据 出 境 过 程 中 的 安全 性 和 可 
性 。 利 用 先进 技术 手段 提高 数据 出 境 安全 评估 的 效 
9 能 和 大 数据 
识别 高 风险 的 数据 
提高 评估 结果 的 准确 性 和 可 靠 性 。 

(3) 完善 个 人 信息 出 境 标 准 合同 模版 ， 提 高 合 规 
运营 的 效率 。《 个 人 信息 出 境 标 准 合同 办 法 》 于 2023 


序 地 跨 境 传输 。 通 过 使 用 标准 合同 模板 ， 我 国 能 够 
过 《个 人 信息 出 境 标准 合同 办 法 》 赋 予 的 法 律 约束 
来 将 境内 的 管辖 权 “ 延 仲 ”至 境外 ， 达 到 一 定 

法 域外 适用 ”的 效果 ， 实 现 数据 跨 境 流 动 保护 。 未 
可 以 将 标准 合同 模板 进行 模块 化 拓展 ， 根 据 组 


以 降低 相关 实体 合 规 运 营 成 本 ， 提 高 效率 。 

(4) 强化 数据 安全 法 治 保障 ， 构 筑 数 据 主权 防线 。 
善 保障 数据 安全 的 法 律 
规 ， 强 化 数据 安全 治理 体系 。 明 确 数据 安全 的 法 律 


责任 ， 保 护 关键 数据 基础 设施 ; 建立 数据 安全 风险 评 


fii 
提 
与 


全 球 数据 治 
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和 应 急 响 应 机 制 ;开展 数据 主权 与 安全 宣传 教育 ， 
高 全 民 数 据 安 全 意识 和 能 力 ; 推动 国际 合作 ， 加 强 
其 他 国家 和 地 区 在 数据 安全 法 律 法 规 方面 的 交流 和 

鉴 ， 共 同 促进 国际 数据 安全 标准 制定 ， 提 升 中 国 在 
理 中 的 话语 权 和 影响 力 。 
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Research on Chinese data sovereignty policy based on 


LDA model and policy instruments 
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Abstract Data sovereignty has become an important component of national sovereignty in the dual context of the digital economy 
development and the overall national security concept. Major countries and regions are actively carrying out data sovereignty strategic 
deployment and engaging in fierce competition in data resources, data technology, and data rules. This work adopts the policy text 
analysis method to study China's data sovereignty policy, and employs the LDA model and policy instruments to quantitatively 
analyze the process evolution and thematic characteristics of China's data sovereignty policy. Drawing on these findings, this study 
comprehensively considers the global data sovereignty policy and puts forward four policy recommendations: actively lead and 
participate in the formulation of international rules, optimize the data export security assessment process, improve the standard contract 
template for personal information export, and strengthen the legal protection of data security. 
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